통계학은 데이터를 수집하고 정리하며 분석한 후 이를 바탕으로 추론과 결정을 내리는 학문입니다. 마치 한 그릇의 팔보조를 맛보듯, 전체를 다 마셔야만 달고 짜는지 알 수 있는 것은 아닙니다. 잘 저어준 후 한 숟가락만 떠먹어도 '일각을 보고 전체를 안다'는 느낌을 얻을 수 있습니다. 이것이 통계 조사의 매력입니다.
핵심 개념: 우리가 다뤄야 할 주체는 누구인가요?
어떤 조사든 시작하기 전에 연구 대상을 명확히 정해야 합니다:
- 모집단 (Population)조사하려는 모든 개체들의 집합입니다.
- 개체모집단을 구성하는 각각의 개체입니다.
- 표본 (Sample)모집단에서 일부를 추출한 개체들입니다.
- 표본 크기 (Sample Size)표본에 포함된 개체의수량주의: 이 값은 단순한 수치이며 단위가 없습니다.
조사 방식의 선택
왜 항상전수 조사전체 대상에 대해 조사하는 방식을 쓰지 않을까요?
장면 A: 인구 조사
예를 들어 2010년 제6차 인구 조사와 같습니다. 매우 높은 정확도가 요구되며, 데이터는 국가 경제와 국민 생활에 직결되므로 '하나도 빠지지 않아야' 합니다.
장면 B: 충격 저항성 시험
어떤 차량의 시료를 충격 테스트하여 내충격 성능을 조사한다면, 전수 조사는 모든 차량을 파손하는 것을 의미합니다. 이 경우,표본 조사부분적인 개체들을 추출하여 조사하고 전체를 추정하는 방식이 유일한 선택입니다.
표본 추출의 과학성과 함정
‘한 숟가락의 국물’이 ‘한 냄비의 국물’을 대표할 수 있도록 하기 위해 반드시간단 무작위 표본 추출원칙을 따르며, 모든 개체가 동일한 확률로 추출되도록 해야 합니다. 다음 세 가지 함정을 피해야 합니다:
- 너무 적음: 표본 크기가 너무 작으면 우연성에 영향을 받기 쉬워 모집단을 객관적으로 반영하지 못합니다.
- 너무 많음: 시간과 노력을 절약하는 목적을 잃게 됩니다.
- 편향: 예를 들어, 주변의 친구들만 조사해 전체 학생의 특성을 추정하는 경우, 표본은 대표성이 없습니다.
🎯 핵심 논리
표본 조사의 핵심은 표본 데이터를 활용해 모집단의 상태를 추정하는 것입니다. 공식적 논리는 $q \approx \frac{p}{n} \times m$이며, 여기서 $q$는 모집단의 추정값입니다.